Play with R 第13期：重复测量设计（GLM 4）

Original 荷兰心理统计联盟荷兰心理统计联盟 2023-02-03

收录于合集 #R语言 62个

R第十三章重复测量设计（GLM 4）

13.1 这章将告诉你什么?

对比同一组被试在多次测量中的平均值时，可以采用重复测量方差分析。

13.2. 重复测量方差设计简介

当我们对重复测量数据进行方差分析时，会发生什么？

“重复测量“ 指同一个实体参与一个实验的所有条件，或者在多个时间点提供数据。

这种类型的设计有许多的优点，但也存在一个很大的缺点。

在第 10 章中，我们看到方差分析中 F 检验的准确性取决于不同条件下的分数是独立的这一假设。当重复测量时，这个假设就被打破了。在不同的实验条件下得到的分数很可能是相关的，因为它们来自同一个参与者。因此，传统的 F 检验缺乏准确性。不同条件下得分之间的关系意味着必须作出一个附加的假设，简单地说，我们假设成对的实验条件之间的关系是相似的(即，实验条件之间的依赖程度大致相等)。这个假设被称为“球形假设”。

13.2.1. 什么是球形假设？

球形假设也可被喻为组间方差分析中的方差齐性假设，它指的是不同水平条件间差异变异的一致性。因此，球形检验需要至少3个条件。

13.2.2. 如何测量球度？

①计算所有水平组合中成对得分之间的差异。

②计算这些差异的方差。

当这些方差大致相等时，就满足了球形度。即：

Variance A–B ≈ Variance A–C ≈ Variance B–C

如果有一组方差与其他组方差差异较大，即存在球度偏离。

13.2.3. 如何评估球度偏离的严重程度？

可使用 Mauchly’s test来检验球形假设的偏离程度，Mauchly可以检验条件之间差异的方差是相等的这一假设。如果 Mauchly 的检验统计量是显著的，则在差异的方差之间有显著的差异。因此，球形的条件是不满足的。然而，如果 Mauchly 的检验统计是非显著的，那么差异的方差并不是非常显著的不同(即，它们大致相等)。

13.2.4.违背球度假设的后果是什么？

违反球形度的影响是Power损失.

13.2.5. 如果你违反了球度，你会怎么做？

第一：可以通过几个修正来生成有效的F-ratio。如Greenhouse-Geisser较正，Huynh–Feldt较正。

第二：使用 F 检验以外的检验。如①不依赖球形假设的MANOVA分析(见 O'Brien&Kaiser，1985)。② 将这些数据作为等级线性模型进行分析(hierarchical linear model详见第 19 章)。以这种方式分析数据时，可以解释模型系数而不用担心球度，因为虚拟编码我们的分组变量确保这些系数只会比较两种情况 (而球度只是比较三种或三种以上平均值时的一个问题)

13.3. Theory of one-way repeated-measures ANOVA

在重复测量方差分析中，我们的实验结果显示在参与者内部的方差中(而不是在组间方差中)。记住,在独立方差分析(第10.2部分) 参与者内部的方差是我们的残差方差(SSR); 它是由个人表现差异造成的差异。这个方差没有受到实验结果的影响，因为无论我们对不同的人进行了什么操作。然而，当我们对同一个人进行实验操作时，参与者内的方差将由两部分组成：我们的操作的影响，和之前一样，表现上的个体差异。所以，一些受试者内部的变化来自于我们的实验操作的影响:我们在每个实验条件下对参与者做了不同的事情，所以个体分数的变化部分是由于这些操作。

例如，如果每个人在一种情况下的得分都比另一种情况高，我们有理由认为这不是偶然发生的，而是因为我们对其中一种情况下的参与者做了不同于其他情况的事情。因为我们在一个特定的条件下对每个人都做了同样的事情，任何不能被我们所做的操作所解释的变化必须是由于我们无法控制的随机因素，与我们的实验操作无关(我们可以称之为‘error’)。与独立方差分析中一样，我们使用F值来比较由实验操作引起的变异大小与由随机因素引起的变异大小，唯一的区别是我们如何计算这些方差。如果我们的操作引起的方差相对于随机因素引起的方差较大，我们就得到了较大的F值，我们可以得出结论，如果在总体中没有影响，观察到的结果就不太可能发生。

图13.2显示了在重复测量方差分析中如何划分方差。值得注意的是，我们有与独立方差分析相同的方差类型: 我们有总平方和(SST)、模型平方和(SSM)和残差平方和(SSR)。重复测量和独立测量的唯一区别在于方差分析是这些平方和的来源：在重复测量方差分析中，模型平方和和残差平方和都是被试内方差的一部分。让我们看一个例子。

图13.2重复测量方差分析的方差分解

I’m a Celebrity, Get Me Out of Here!（我是个名人，带我出去!）

WARNING: 以下内容不适合吃饭，吃饭前，及饭后阅读，以免引起不适……毕竟我们书本的作者有时候有恶趣味……

这是一个电视节目，其中的名人(其实他们并不是真正的名人，更像是前名人)，在一个可怜的尝试挽救他们的事业(或只是有事业的第一个地方)，去澳大利亚的丛林生活几个星期。在节目中，这些参加者要做各种各样的耻辱任务来为他们的同伴赢得食物。这些任务总是涉及到爬行动物不应该去的地方的爬行;例如，你可能被锁在一个满是老鼠的棺材里，被迫把你的头放在一碗大蜘蛛里，或者让鳗鱼和蟑螂倒在你身上。这是残酷的电视节目，而我喜欢它。作为一个素食主义者，我特别喜欢的一个任务是bushtucker试验，在这个试验中，名人必须吃一些东西，比如活的竹节虫、女巫幼虫、鱼眼和袋鼠睾丸/阴茎。说实话，看到一只炸鱼眼在别人嘴里爆炸，永远会在你脑海里留下他们的形象。我常常想知道(也许有点想太多了)哪种bushtucker食物最让人恶心。

想象一下，我让八位名人来做这个测试，强迫他们吃四种不同的动物(前面提到的竹节虫、袋鼠睾丸、鱼眼和木蠹蛾幼虫)。每一次，我都以秒为单位来计算名人呕吐的时间。这是一个重复测量的设计，因为每个名人都吃每种食物。自变量是食物的种类，因变量是呕吐的时间。

本例的数据见表13.2。有四种食物，每一种都由八位不同的名人食用。他们呕吐的时间被显示出来。此外，表中还显示了每位名人干呕的平均时间(以及干呕所花时间的差异)，以及吃的每一件食物干呕的平均时间。干呕时间的总差异，部分是由于不同的动物可口的差异(操纵)，并将在一定程度上是由于事实，名人本身将不同的体质(个人差异)。

13.3.1. The total sum of squares (SST)

记住，从单因素独立方差分析中，SST的计算公式如下(见式(10.4)):

在重复测量设计中，总平方和的计算方法完全相同。当我们忽略他们所属的组时，方程中的最大方差就是所有分数的方差。因此，如果我们把数据作为一个大的组，它将看起来如下:

这些分数的方差是8.19(用计算器算一下)。我们用32分来生成这个值，所以N是32。因此，方程变成:

与独立方差分析一样，这个平方和的自由度是N−1=31。

13.3.2. The within-participant sum of squares (SSW)

此设计的关键区别在于有一个方差成份称为within-participant组内方差(之所以出现此情况，是因为我们在每个参与者中都操纵了我们的自变量)。这是用平方和来计算的。一般来说，当我们计算任何平方和时，我们都要平均数与个人分数之差的平方。这可以用分数间的方差和方差所基于的分数数目来表示。例如，当我们在独立方差分析(SSR)中计算残差平方和时，我们使用以下方程(回头看方程(10.7)):

这个方程给了我们一个特定群体中个体之间的方差，也是一个特定群体中个体差异的估计。因此，为了得到个体差异的总价值，我们必须计算每个组内的平方和，然后将它们相加:

当我们在每一组中有不同的人时，这一切都很好，但在重复测量设计中，我们让人们经历了不止一个实验条件，因此，我们感兴趣的不是群组的变异(如独立方差分析), 而是在一个真实的人体内变异。也就是说，一个人的可变性有多大?为了找出这一点，我们实际上使用了相同的等式，但我们将其应用于人而不是群体。因此，如果我们称这个平方和为SSW(被试内的SS)，我们可以把它写成:

这个方程仅仅意味着我们在观察一个人的分数变化，然后把所有人的分数变化加起来。ns表示方差所基于的分数的数量(即，实验条件的数量，或者在这种情况下食物的数量)。我们需要的所有方差都在表13.2中，所以我们可以计算SSW为:

每个人的自由度为n - 1(即，条件的数目减1)。为了获得总的自由度，我们添加了所有参与者的dfs。有八个参与者(名人)和四个条件 n = 4)，每个名人有3个自由度，共8×3 = 24个自由度。

13.3.3. The model sum of squares (SSM)

到目前为止，我们知道数据内的总变异量是253.58个单位。我们还知道236.50个单位是由个人的(名人)在不同条件下的表现：有些变化是我们实验操作的结果，有些变化只是随机波动。下一步是计算出我们的操作能解释多少差异，而不能解释多少差异。

在独立方差分析中，我们通过观察每组的平均值并将其与总体平均值进行比较，计算出我们的实验(模型SSM)可以解释多少变化。因此，我们测量了组均值与总体均值之间的差异所产生的方差(见(10.5))。对于重复度量的设计，我们做的是完全相同的事情。

首先，我们计算每个独立变量水平的平均值(在本例中为每种食物的平均呕吐时间)，并将这些值与所有食物的总体平均值进行比较。因此，我们用与独立方差分析相同的方法计算这个SS:

1计算各组均值与总均值的差值。

2平方这些差值。

3将每个结果乘以贡献该平均值(ni)的参与者数量。

4把每个组的值加在一起

利用bushtucker数据的方法(见表13.2)，我们可以计算SSM如下:

对于SSM，自由度(dfM)再次比用来计算平方和的东西的数量少1。对于模型平方和，我们计算了四个平均值与总平均值之间的平方和误差。因此，我们用四种方法来计算这些平方和。所以自由度是3。因此，与独立方差分析一样，模型自由度总是条件的数量

(k) - 1: dfM = k-1 = 3

13.3.4. The residual sum of squares (SSR)

我们现在知道，在我们的数据中有253.58个单位的变化需要解释，而我们的条件中的变化占了236.50个单位。在这236.50个单位中，我们的实验操作可以解释83.13个单位。最后的平方和是残差平方和(SSR)，它告诉我们有多少变化不能被模型解释。这个值是由实验控制之外的外来因素引起的变化量。已知SSW和SSM，计算SSR最简单的方法是从SSW中减去SSM (SSR = SSW−SSM):

13.3.5. The mean squares

SSM告诉我们模型(例如，实验操作)解释了多少变化，SSR告诉我们有多少变化是由于外部因素造成的。然而，因为这两个值都是求和值，所以求和的分数的数量会影响它们。与独立方差分析一样，我们通过计算平方和的平均值(称为均方差，MS)来消除这种偏差，均方差就是平方和除以自由度:

MSM表示模型解释的平均变异量(如系统变异量)，而MSR表示外部变量(非系统变异量)解释的平均变异量。

13.3.6. The F-ratio

F值是模型解释的变异与非系统因素解释的变异之比的度量。通过将模型的均方除以残差均方可以计算出。你应该记得，这与独立方差分析是完全相同的:

因此，与独立方差分析一样，f比率仍然是系统变异与非系统变异的比率。因此，它是实验效果与无法解释的因素对性能的影响之比。对于bushtucker数据，F-ratio为:

该值大于1，说明实验操作的效果在一定程度上超出了外界因素的影响。与独立方差分析一样，该值可以与基于其自由度的临界值(即dfM和dfR，在本例中分别为3和21)进行比较。

13.3.7. The between-participant sum of squares

我提到总变异被分解为参与者内变异和参与者间变异。我们忘记了参与者之间的变量因为我们不需要它来计算f比率。但是，我将简要地介绍它所代表的内容。计算这一项最简单的方法是减法，因为我们从图13.2中知道:

现在，我们已经计算了SST和SSW，所以通过重新整理方程，替换这些项的值，我们得到:

这一术语表示被试之间的个体差异。所以，在这个例子中，不同的名人对吃这些食物有不同的容忍度。（表13.2所示为名人的方式。）例如，名人4 (M = 4.50)比参与者8 (M = 6.75)平均快2秒呕吐。名人的体质比名人好。参与者之间的平方和反映了个体之间的这些差异。在这种情况下，只有17.08个单位的时间变化可以解释我们的名人之间的个人差异。

13.4 One-way repeated-measures designs using R (使用R进行单因素重复测量分析)

13.4.1 重复测量分析所使用的R packages

此处共列出四种方法：

1） Anova():我们已在其他章节使用过次函数，适用于球形检验与矫正。但是此函数并没有遵从实际的ANOVA计算方法，因此不再赘述。

2） Lm()或aov():这两个函数遵从了ANOVA计算方法，但不能用于球形检验。建议使用lme()

3） Lme():这个函数可以完成所有ANOVA相关计算，唯一的不足是和SPSS或者SAS的统计步骤差异较大，如果你使用不习惯可以用ezANOVA().

4） ezAnova():可以轻松完成ANOVA，并且与其他统计包方法一致。

以下是你要用到的包：

你要加载包的语句：

13.4.2 重复测量分析的步骤

1）导入数据

2）探索数据：描述性统计数据，画图，球形检验等

3）构建或选择对比条件（contrast）

4）计算ANOVA模型

5）计算对比条件(contrast)或者事后检验

13.4.3 导入数据

使用Bcushtucker.dat，在这个数据列表中，我们记录了每名被试吃到四种食物后分别呕吐的时长。每个被试的id对应四列测量数据：竹节虫、袋鼠睾丸、鱼眼和木蠹蛾幼虫食用后的诱发呕吐时长。此处我们创建一个新的数据表格，叫做longBush，使用melt()函数，如下：

数据表格中所对应的id,食物种类，以及呕吐时长会被默认命名为被试，变量，和数值。为了更加清楚知道每个值所代表什么，我们将这些数据重新命名为，被试，动物，呕吐时长，如下：

接下来，我们将Animal变量的四个水平进行命名：

我们将看到新的表格变化为：

如果想将数据直接导入R，我们首选要使用gl()函数创建对应被试的变量：

接下来用label选项列出8个被试编号：

这些编号用于告诉R我们有8组数据，每组数据有4个值。为了创建animal变量，我们需要4组，每组包含1个数值。因此，每名被试对应有4个值。在这里，因为有8名被试，所以我们使用gl()函数来重复这一模式：

接下来，我们再讲对应的变量“诱发呕吐时间”对应上：

最后，我们将这些变量整合到longBush这一数据框架中：

13.4.4 探索数据

使用ggplot()绘制不同animal的诱发呕吐时间，这里可使用bar图以及箱型图。

13.4.5 选择对比条件（contrasts）

在单因素方差分析中，我们编码想要对比的条件。假设，我们认为由于眼睛和睾丸与人体部位更像，因此人们吃完它们会觉得比吃竹节虫和木蠹蛾幼虫更恶心。因此，首先我们对比鱼眼睛和袋鼠睾丸（组合）与竹节虫和木蠹蛾幼虫（组合）之间的恶心程度。我们第二个对比则是，鱼眼睛和袋鼠睾丸之间，以及竹节虫和木蠹蛾幼虫之间的恶心程度。编码如下：

基于此表格，我们创建变量代表contrasts:

请记住正数用于对比负数，0则代表不参与对比。

13.4.6 重复测量分析的两种方法

13.4.6.1 最容易的方法

使用ezANOVA()包来做重复测量方差分析。优点是跑出来的记过与SPSS或SAS近似，可用于计算球形检验。使用这个函数的格式是：

这将从你的数据框架中创建一个新的模型。你可以设置如下几个选项：

1） dv:在本例子中代表数值，也就是诱发呕吐时长

2） wid:代表被试

3） within:被试内变量，本研究中代表动物类型

4） between:被试间变量，可用于混合设计，本研究中没有

5） detailed:默认值为FALSE

6） type:总平方和的类型

以下是跑出来的结果：

通过上述结果，我们可以看出：球形检验应该是不显著不显著。但是本结果中p值小于0.05，因此我们拒绝不同水平间的差异变异相等的假设。换句话说，我们违背了球形假设。Animal变量的F值是3.79，p值显著。因此，我们可以四种动物对于诱发呕吐的时长有显著性差异。接下来我们来做时候检验，确定动物之间的差异。我们可以使用pairwise.t.test()函数来做post hoc test，格式如下：

通过跑出来的结果我们看出，竹节虫诱发呕吐时长显著长于袋鼠睾丸（p = .012）和鱼眼睛（p = .006），但是和木蠹蛾幼虫没有显著性差异。吃袋鼠睾丸和鱼眼睛之间以及和木蠹蛾幼虫没有差异，吃鱼眼睛和木蠹蛾幼虫之间也没有差异。

13.4.7.2 更复杂的方法：多层方法

我们将使用线性模型方法非常适用于重复测量实验设计。优点是我们可以继续认为这种分析是一种线性模型。我们将使用另一个函数，lme()而不是aov(),以下是函数的格式：

我们可以将模型简化为：

这里Participant/Animal含义是Animal是被试内变量，并且是模型中的predictor。如果我们想知道是否Animal具有整体效应，我们需要将上个模型对比一个没有predictor的新模型，如下：

这样做的含义是对比两个模型以判断是否Animal可以显著预测模型，以下是跑出来的结果：

此处p值小于0.05，说明Animal是对于呕吐时长的显著预测因素。接下来，我们进行事后检验：

我们可以得出与刚才方法同样的结论。

13.4.7 robust单因素重复测量方差分析

我们加载WRS包，其中包含四种函数：rmanova(), rmmcp(), rmanovab(), pairdepb()；其中rmanova()使用截断平均值（trimmed mean），而ramanovab()采用bootstrap，rmmcp()与pairdepb()分别是这二者的事后检验函数。

继续使用上文中例子，首先创建一个没有被试编号的数据结构：

我们可以使用rmanova()或者ramnovab()函数，格式分别为：

接下是两种方法跑出的结果：

从结果中可看出，p值为0.1002大于0.05，因此Animal对呕吐时长没有显著影响。事后检验函数如下，包含两种方法：

结果如下，分别对应trimmed mean和bootstrap两种方法：

Trimmed mean方法中由于所有的p.value均大于p.crit，所以我们得出结论没有组间差异。

Bootstrap方法中所有test值大于critical值，因此我们也得出同样结论。

13.5 Effect sizes for repeated-measures designs （重复测量设计的效应量）

对于独立方差分析，测量总效应量大小的最好方式就是ω2。在本书之前提到的ω2的公式是不能直接用于计算重复方差测量设计得到的效应量的，因为之前的公式会有一些过高的估计实际的效应量。所以我们建议采用以下的公式：

公式中，MSM表示模型的均方，MSR表示残差的均方，k表示实验的条件数，在本示例中是4个条件（分别是四种animals），n表示被试数（本例中是Celebrities的个数，即8个）。

我们还常用η2来估计方差的效应量（Bakeman, 2005），在R中可以用ezANOVA()这个函数，本例生成结果中有一列名为ges的列标签就是指的η2的值，如13.2的结果中，对于Animal而言，其η2值的大小为.3274。

对于效应量大小的测量我们最好是进一步关注条件间的比较，而不是看方差的主效应。一个更加容易计算效应量大小的方法就是去计算前文提到的条件间的对比（可参照13.5的结果）。作者用了如下的公式把t值转换成了r：

在10.7节中，作者写了一个rcontrst()的函数来计算以上的公式，具体的下载包可参见3.4.5节中的内容。我们可以利用这个包中的命令来计算条件之间的r（t值和df来自13.5的输出结果）：

r值的计算结果如下：

结果显示，示例中的body parts和whole animals之间的差异具有较大的效应量（r=.57），stick insect和witchetty grub之间的差异具有中等大小的效应量（r=.39），testicle和eyeball之间的差异具有很小的效应量（r=.02）。

13.6. Reporting one-way repeated-measures designs

我们在进行重复测量方差分析时报告的内容取决于我们如何做。如果你使用了传统的方差分析方法(例如，使用ezANOVA)，那么你报告的细节与独立的方差分析相同。我们应该关心的唯一额外的事情是，如果球度被破坏，报告修正的自由度。就我个人而言，我也热衷于报告球形度测试的结果。与独立方差分析一样，用于评估F-ratio的自由度是模型效果的自由度(dfM = 1.60)和模型残差的自由度(dfR = 11.19)。请记住，在本例中，我们使用了球度的Greenhouse–Geisser对两者进行了修正，这就是为什么自由度是这样的。因此，我们可以将主要发现报告为:

Mauchly’s 检验说明违背了球形假设，χ2(5) = 11.41, p < .05,因此，本研究报告Greenhouse–Geisser校正值(ε = .53). 结果表明，食用动物种类对呕吐时间有显著影响F(1.60, 11.19) = 3.79, p > .05, η2 = . 327。

或者，我们可以报告Huynh-Feldt修正值:

Mauchly’s 检验说明违背了球形假设，χ2(5) = 11.41, p < .05,因此，本研究报告Huynh–Feldt校正值(ε = .67). 结果表明，结果表明，食用动物种类对呕吐时间有显著影响F(2, 13.98) = 3.79, p < .05, η2 = . 327.

如果你做了一个多层次的模型，你会写你的结果不同的(你也可以把结果放在一个表中，如第19.8节):

食用的动物种类对呕吐时间有显著影响χ2(3)= 12.69, p = .005. 正交对比显示，动物部分(睾丸和眼睛)的呕吐时间明显快于整个动物(竹节虫和木蠹蛾幼虫)。b = 1.38, t (21) = 3.15, p = .005; 吃了袋鼠睾丸和鱼眼后，呕吐的时间没有显著差异b = −0.063, t(21) = −0.101, p = .920；吃木蠹蛾幼虫和竹节虫也没有显著差异b = −1.188, t(21) = −1.924, p = .068。

13.7 阶乘重复测量设计

可以将简单的组间设计扩展为合并第二（或第三）独立变量。将第二，第三甚至第四独立变量合并到重复测量分析中。以下例子中有两个独立变量：饮料的类型（啤酒，葡萄酒或水）和所使用的图像类型（正，负或中性）。这两个变量完全交叉，产生了九个实验条件。

举例：

科学家设计了一项研究，通过比较不同类型饮料的负面图像与正面图像和中性图像的影响来解决这一问题。在一个环节中，他们看到了三则广告：

（1）带有负面形象的啤酒品牌（Brain Death）（“饮酒性脑死亡会使您的肝脏爆炸”）；

（2）以正面形象呈现的葡萄酒品牌（Dangleberry）（“喝Dangleberry葡萄酒使您无法抗拒”）；

（3）带有中性形象的水牌（Puritan）（“饮用Puritan的水可以使您的行为完全正常”）。

第二阶段（一周后），参与者看到了相同的三个品牌。这次Brain Death伴随着正面形象，Dangleberry伴随着中性形象，Puritan伴随着负面形象。在第三部分中，Brain Death伴随着中性图像，Dangleberry伴随着负面图像，Puritan伴随着正面图像。每个广告之后，要求参与者对饮料进行评分，评分范围为-100（非常不喜欢）到0（中性）到100（非常喜欢）。广告顺序随机，人们参加这三个环节的顺序也是随机的。

13.7.1 输入数据

变量组是两个预测变量（图像和饮料类型）的混合。

可以执行：longAttitude <-melt(attitudeData, id = "participant", measured = c( "beerpos",

"beerneg", "beerneut", "winepos", "wineneg", "wineneut", "waterpos", "waterneg",

"waterneut"))

13.7.2 分析数据

为了获得饮料和图像组合水平的描述性统计数据，执行以下操作：

by(longAttitude$attitude, list(longAttitude$drink, longAttitude$imagery),

stat.desc, basic = FALSE)

13.7.3 设定对比

与单向重复测量设计一样，在进行主要分析之前，需要设置对比。对比非常重要，因为

（1）它们可以帮助我们将任何主要效果或相互作用分解为更可解释的效果；

（2）如果您使用III类平方和，则必须首先设置（正交）对比以便正确计算它们。在此示例中，我们需要为饮料和图像设置对比。

13.7.4 阶乘重复测量方差分析

可以使用ezANOVA()函数。在within = .(). 中标记的选项中指定重复测量的预测变量。当有多个预测变量时，可以简单地列出以逗号分隔的预测变量。其余功能与前面的示例相似。

13.7.5 阶乘重复测量设计作为GLM

此前使用了lme()，得到线性模型中的重复测量数据。将模型扩展到包括每个预测变量和任何交互。如果要查看单个效果，则从基线开始构建模型。

13.8 Effect sizes for factorial repeated-measures designs （因素重复测量设计的效应量）

对于单因素重复方差测量，仅计算ω2就已经足够了。所以对于因素重复测量设计我们这里先不讨论单因素重复方差测量。对于函数ezANOVA生成的η2结果（见13.11的输出结果），imagery的主效应量是.575，drink的主效应量是.116，它们之间的交互作用效应量是.141，结果显示出一个很强的imagery主效应量，但是drink和其余imagery之间的交互作用的效应量却相对来说比较小。

就如作者之前所说，当你得到了因素实验设计的结果时，还是建议更进一步计算条件之间的效应量大小，比如对于任意的主效应可以比较两组之间的差异。可以采用rcontrast()这个函数，以13.6为例，简单的放入t值与相对应的自由度即可。对于drink而言有两个可以比较的因素：alcohol vs. water

如结果所示，对于那些显著的交互作用结果（beer vs. wine, negative vs. other imagery）会得到一个相对较大的效应量。其它不显著的交互作用结果会得到一个较小的效应量（其值都小于0.1）。

13.9 Reporting the results from factorial repeated-measures designs （因素重复测量设计的结果报告）

从以上可以看到，怎样去报告重复方差测量的结果取决于你怎样去计算它。如果你采用传统的方差分析方法（如采用ezANOVA函数），就需要报告三个效应，并且这些效应有可能具有不同的自由度。对于drink和imagery的主效应，球形假设就不成立，这时需要报告Greenhouse–Geisser矫正过的自由度。

其次，我们还需要报告三个效应的详细结果：

如果你做了一个多层模型，你需要写不同的结果（你也可以如19.8节中的结果一样放入一个表中）：

参考文献：

Field, A. P. (1998). A bluffer’s guide to sphericity. Newsletter of the Mathematical, Statistical and Computing Section of the British Psychological Society, 6(1), 13–22. (Available in the additional material for this chapter.)

Howell, D. C. (2006). Statistical methods for psychology (6th ed.). Belmont, CA: Duxbury. (Or you might prefer his Fundamental Statistics for the Behavioral Sciences, also in its 6th edition, 2007.)

Rosenthal, R., Rosnow, R. L., & Rubin, D. B. (2000). Contrasts and effect sizes in behavioural research: A correlational approach. (Cambridge: Cambridge University Press. This is quite advanced but really cannot be bettered for contrasts and effect size estimation.)

Field, A. P. (2006). The behavioral inhibition system and the verbal information pathway to children’s fears. Journal of Abnormal Psychology, 115(4), 742–752.

本期排版：孟雪

本期笔记整理人员：

付迪中科院心理所

李昂扬北师

李阳萍陕西师范大学（陕西省西安市）

吴桃宇北京大学（北京市）

王烁北京师范大学（北京）

~~~~~~~~~~~~~~~~~~

往期回顾：

Play with R 第1期：为什么要学习统计

Play with R 第2期:关于统计学你所想要知道的一切(嗯,部分内容吧)

Play with R 第3期：R基本知识